Analisis de ciclos en (LAS BAMBAS)¶

Import Packages¶

Este chunk configura el entorno de análisis de datos y las librerías necesarias para el proyecto. Se establecen las configuraciones de visualización y se importan todas las dependencias requeridas para:

📊 Análisis de datos: pandas, numpy para manipulación y cálculos estadísticos 📈 Visualización: plotly para gráficos interactivos con configuración optimizada para notebooks 🧮 Estadísticas: scipy.stats, statsmodels, pingouin para pruebas estadísticas y análisis avanzados 🔬 Análisis avanzado: gaussian_kde para estimación de densidad kernel y cálculos de probabilidad

La configuración incluye supresión de warnings para mantener limpia la salida y ajustes de plotly para garantizar compatibilidad con exportación HTML estática.

Import data and preprocessing¶

Este chunk se encarga de la carga y transformación inicial de los datos de rendimiento TKPH (Toneladas por Kilómetro por Hora) de los camiones mineros. Se realiza un preprocesamiento completo que incluye:

🚛 Filtrado de modelos: Se seleccionan únicamente los camiones de interés:

  • KOM 980E (Komatsu 980E)
  • CAT 797F (Caterpillar 797F)
  • CAT 798AC (Caterpillar 798AC)

⚙️ Creación de variables calculadas:

  • Velocidad: Cálculo de velocidad promedio del ciclo (km/h)
  • Hora: Extracción de la hora del día (0-23) para análisis temporal
  • Peso delantero ajustado: Cálculo del peso distribuido en las llantas delanteras según especificaciones técnicas de cada modelo

🎯 Reglas de negocio aplicadas:

  • Porcentajes de distribución de peso específicos por modelo de camión
  • Ajuste especial del +6% para operaciones desde pit CHALCOBAMBA hacia Chancador
  • Manejo de valores faltantes y validación de datos

Los datos procesados quedan listos para análisis estadísticos, visualizaciones y generación de reportes de performance operacional.

Especificaciones Técnicas - Distribución de Peso en Llantas Delanteras

MODELO EVW_FRONT GVW_FRONT Descripción
CAT 797F 48.5% 32.8% Caterpillar 797F
CAT 798AC 47.0% 33.0% Caterpillar 798AC
KOM 980E 48.5% 32.8% Komatsu 980E
📏 1. Calculando Velocidad...

📏 2. Calculando Hora...

📏 3. Peso ajustado...

Analisis de payload¶

Este chunk realiza un análisis estadístico completo de la distribución de tonelaje de carga (payload) utilizando dos enfoques complementarios:

Análisis de Distribución por Rangos Operacionales¶

Se implementa una clasificación por rangos basada en umbrales operacionales críticos:

  • Verde (< 363 ton): Zona de subcarga
  • Amarilla (363-400 ton): Zona de transición
  • Roja (400-436 ton): Zona objetivo
  • Negra (> 436 ton): Zona de sobrecarga

El análisis genera un gráfico dual que combina:

  1. Histograma de densidad: Visualización de la distribución real de tonelaje
  2. Tabla resumen: Porcentaje de ciclos que caen en cada rango operacional

Cálculo de Probabilidades usando Kernel Density Estimation (KDE)¶

Se calcula P(Tonelaje > 400) mediante dos métodos estadísticos:

Método KDE: Utiliza estimación de densidad kernel para crear una función de densidad continua, seguida de integración numérica (trapezoides y cuadratura adaptativa de scipy) para calcular probabilidades exactas.

Método Empírico: Cálculo directo basado en la proporción observada de datos que superan el umbral.

La comparación entre ambos métodos valida la robustez del análisis. El chunk incluye visualización interactiva que muestra el área bajo la curva correspondiente a la probabilidad calculada, proporcionando una interpretación intuitiva del resultado estadístico.

📊 CREANDO GRÁFICO DE DENSIDAD DE TONELAJE
==================================================
✅ Datos de tonelaje: 68061 registros válidos
Rango: 321.0 - 464.0 toneladas

📋 DISTRIBUCIÓN POR RANGOS
==================================================
📈 ESTADÍSTICAS ADICIONALES
==================================================
Total de ciclos analizados: 68,061
Tonelaje promedio: 400.4 ton
Tonelaje mediano: 401.0 ton
Desviación estándar: 15.8 ton
🔬 CÁLCULO DE P(TONELAJE > 400) USANDO KERNEL DENSITY ESTIMATION
======================================================================
📊 Datos: 68,061 observaciones de tonelaje
🎯 Calculando: P(Tonelaje > 400)

📈 PASO 1: CREANDO KERNEL DENSITY ESTIMATOR
==================================================
✅ KDE creado exitosamente
Bandwidth (ancho de banda): 0.1080
Número de puntos de datos: 68061
Rango de datos: [321.0, 464.0] toneladas

🧮 MÉTODO 1: INTEGRACIÓN POR TRAPEZOIDES
=============================================
Puntos de integración: 2000
Rango de integración: [400, 464.0]
✅ P(Tonelaje > 400) = 0.514271
   En porcentaje: 51.427%

🔬 MÉTODO 2: INTEGRACIÓN SCIPY (CUADRATURA ADAPTATIVA)
============================================================
✅ P(Tonelaje > 400) = 0.514271
   En porcentaje: 51.427%
   Error estimado: 1.08e-12

📊 COMPARACIÓN CON MÉTODO EMPÍRICO
=============================================
Empírico:     P(T > 400) = 0.501095 (50.109%)
KDE (Scipy quad): P(T > 400) = 0.514271 (51.427%)

Diferencia absoluta: 0.013177
Diferencia porcentual: 1.318 puntos porcentuales
✅ Buena concordancia entre métodos

Ciclos observados > 400: 34105 de 68061 total

📊 CREANDO VISUALIZACIÓN...
💻 FUNCIÓN REUTILIZABLE PARA KDE
========================================

🔧 EJEMPLO DE USO:
--------------------
Método: KDE + Scipy quad
P(Tonelaje > 400) = 0.514271
Porcentaje: 51.427%
Error estimado: 1.08e-12

✅ RESULTADOS FINALES
==============================
🎯 Umbral analizado: 400 toneladas
📊 Método usado: KDE con Scipy quad
🔢 P(Tonelaje > 400) = 0.514271
📈 Porcentaje: 51.427%
📋 Interpretación: De cada 1000 ciclos, aproximadamente 514 tendrán tonelaje > 400

Pesos delanteros¶

Este chunk implementa un análisis exhaustivo de la regla operacional especial que aplica un ajuste del +6% al peso distribuido en llantas delanteras para operaciones desde el pit CHALCOBAMBA hacia destinos que contienen "Chancador".

Análisis de Impacto Operacional¶

Se cuantifica la frecuencia de aplicación de la regla especial:

  • Conteo total de operaciones afectadas
  • Porcentaje de ciclos con ajuste vs operaciones normales
  • Análisis de rutas específicas desde CHALCOBAMBA

Visualización de Distribuciones Comparativas¶

Genera un dashboard de 4 paneles que compara las distribuciones de peso delantero:

  1. Histogramas de densidad: EVW y GVW delantero separados por condición normal/ajustada
  2. Box plots comparativos: Visualización de estadísticas descriptivas y detección de outliers

Análisis Estadístico Robusto¶

Implementa pruebas estadísticas no paramétricas (Mann-Whitney U) para determinar si las diferencias entre grupos son estadísticamente significativas, evitando asumir normalidad de los datos.

Segmentación Multi-dimensional¶

Desglosa el análisis por:

  • MODELO: Distribución de ajustes por tipo de camión (KOM 980E, CAT 797F, CAT 798AC)
  • EQUIPO: Identifica equipos específicos más afectados por la regla, ordenados por número absoluto de ajustes

Visualizaciones Multi-panel¶

  • Gráficos de barras apiladas mostrando proporción de ajustes por modelo
  • Box plots comparativos de peso delantero por modelo
  • Heatmap por equipo correlacionando ciclos totales con porcentaje de ajustes
🎯 ANÁLISIS COMPLETO - REGLA ESPECIAL AJUSTE CHALCOBAMBA
======================================================================
✅ Todas las columnas necesarias están presentes

📊 ESTADÍSTICAS GENERALES 
=======================================================
Tipo_Registro Cantidad Porcentaje (%) Media_Distancia_KM
0 Con Ajuste 16,485 24.22% 16.62
1 Sin Ajuste 51,576 75.78% 10.29
2 Total 68,061 100.00% 11.83
🏗️ ANÁLISIS POR PIT Y DESTINO
================================================================================
--------------------------------------------------------------------------------

📊 RESUMEN COMPLETO POR PIT:
------------------------------------------------------------------------------------------------------------------------
Num_Ciclos Dist_Media_KM Dist_Total_KM Dist_Min_KM Dist_Max_KM Dist_Std_KM Ciclos_Con_Ajuste Horas_Totales Pct_Con_Ajuste Pct_Del_Total
PIT
CHALCOBAMBA 34240 11.24 384863.48 0.29 61.34 6.64 16485 23575.57 48.1 50.31
FERROBAMBA 33821 12.42 420065.65 0.26 55.90 5.21 0 29689.24 0.0 49.69
📋 DESTINOS DESDE CHALCOBAMBA:
Num_Ciclos Dist_Media Dist_Min Dist_Max Dist_Std Con_Ajuste Pct_Con_Ajuste
COMP_DESTINO
Botadero 22,755 8.18 0.54 43.51 4.50 6,967 30.6%
Chancador 5,055 21.05 0.29 61.34 5.40 5,055 100.0%
Stock Sulfuros 4,685 14.27 0.88 46.73 4.41 3,349 71.5%
Stock Mixtos 1,525 15.53 2.22 53.28 4.78 985 64.6%
Inpit 208 7.58 0.49 22.69 4.15 124 59.6%
Stock Óxidos 12 12.30 7.98 15.78 2.85 5 41.7%
📈 CREANDO GRÁFICOS DE DENSIDAD DE PESO DELANTERO...
🧮 ANÁLISIS ESTADÍSTICO COMPARATIVO
=============================================

PESO GVW DELANTERO:
-------------------------
Normal    (n=51,576): μ=110.5, σ=2.8
Ajustado  (n=16,485): μ=114.6, σ=3.0
Diferencia de medias: +4.1 ton (+3.7%)

📊 PRUEBAS ESTADÍSTICAS:
-------------------------
GVW - Mann-Whitney U: p-value = 0.00e+00
GVW - Diferencia significativa: SÍ

🚛 ANÁLISIS POR MODELO DE CAMIÓN
=============================================
RESUMEN POR MODELO:
-------------------------
MODELO Total_Ciclos Con_Ajuste Sin_Ajuste Pct_Ajuste GVW_Delantero_Prom
1 CAT 797F 33619 7914 25705 23.54 111.89
0 KOM 980E 32750 8274 24476 25.26 111.24
2 CAT 798AC 1692 297 1395 17.55 109.20
🔧 ANÁLISIS POR EQUIPO
==============================
TOP 10 EQUIPOS POR NÚMERO DE CICLOS AJUSTADOS:
----------------------------------------
HT112           | KOM 980E   | 2,462 ciclos |  653 ajustes ( 26.5%)
HT113           | KOM 980E   | 2,436 ciclos |  635 ajustes ( 26.1%)
HT083           | CAT 797F   | 2,410 ciclos |  625 ajustes ( 25.9%)
HT080           | CAT 797F   | 2,459 ciclos |  625 ajustes ( 25.4%)
HT104           | KOM 980E   | 2,263 ciclos |  620 ajustes ( 27.4%)
HT108           | KOM 980E   | 2,307 ciclos |  615 ajustes ( 26.7%)
HT115           | KOM 980E   | 2,276 ciclos |  610 ajustes ( 26.8%)
HT101           | KOM 980E   | 2,398 ciclos |  599 ajustes ( 25.0%)
HT071           | CAT 797F   | 2,304 ciclos |  588 ajustes ( 25.5%)
HT073           | CAT 797F   | 2,410 ciclos |  579 ajustes ( 24.0%)
✅ RESUMEN EJECUTIVO - REGLA AJUSTE CHALCOBAMBA
============================================================
📊 IMPACTO OPERACIONAL:
• Total de operaciones analizadas: 68,061
• Operaciones con ajuste especial: 16,485 (24.22%)

⚖️ IMPACTO EN PESO DELANTERO:
• GVW Delantero: +4.1 ton promedio (+3.7%)

🚛 DISTRIBUCIÓN POR MODELO:
• CAT 797F: 7914 ajustes de 33,619 total (23.5%)
• KOM 980E: 8274 ajustes de 32,750 total (25.3%)
• CAT 798AC: 297 ajustes de 1,692 total (17.6%)

📉 ANÁLISIS DE PESOS TRASEROS
⏱️ ANÁLISIS FULL_TRAVEL (HORAS)
Promedio FULL_TRAVEL_HRS Normal:   0.38 hrs
Promedio FULL_TRAVEL_HRS Ajustado: 0.39 hrs
📊 MATRIZ PIT vs DESTINO (Número de operaciones):
----------------------------------------------------

🔍 IDENTIFICANDO DESTINOS COMPARTIDOS...
PITs encontrados: CHALCOBAMBA, FERROBAMBA

✅ RESULTADO FINAL:
====================================================================================================
DESTINO Num_PITs PITs_Str Total_Operaciones Distancia_Promedio Coef_Variacion_Dist pct_CHALCOBAMBA pct_FERROBAMBA
0 CHANCADO 2 FERROBAMBA | CHALCOBAMBA 11391 15.05 47.36 44.377 55.623
2 BOT-F02-4195-RAM 2 FERROBAMBA | CHALCOBAMBA 3489 15.39 33.48 0.717 99.283
4 BOT-4525-PD-HHROESTE 2 CHALCOBAMBA | FERROBAMBA 670 4.14 94.21 99.851 0.149
1 BOT-SUR-4170 2 FERROBAMBA | CHALCOBAMBA 177 15.16 34.20 1.130 98.870
3 BOT-ZARANDA-ING-RECLA 2 FERROBAMBA | CHALCOBAMBA 53 17.93 23.55 3.774 96.226
5 IP-PISO-P12 2 FERROBAMBA | CHALCOBAMBA 32 6.02 93.45 46.875 53.125
6 IP-PISO-LD001 2 CHALCOBAMBA | FERROBAMBA 4 6.56 84.60 50.000 50.000

Analisis temporal¶

⏰ Análisis por Hora del Día¶

  • Se analizaron los ciclos en función de la hora del día.
  • Se compararon:
    • Volumen de ciclos realizados
    • Tonelaje transportado (mediana por hora)
    • Tiempo de ciclo (mediana en horas)
    • Distancia recorrida (mediana en km)
  • Identificación de horas pico y valle de actividad.

🔍 Análisis de Gaps (huecos operativos)¶

  • Un gap se define como el tiempo transcurrido entre el fin de un ciclo (dumping) y el inicio del siguiente (loadloading).
  • Se midieron:
    • Cantidad de gaps por hora y por equipo
    • Duración total y promedio de los gaps
  • Visualizaciones clave:
    • Distribución global de gaps por hora del día.
    • Heatmap global de gaps (equipos vs horas).
    • Heatmap diario filtrable por fecha (permite revisar jornadas específicas).
    • Serie temporal del % de tiempo total perdido en gaps diarios.

🕒 Análisis de Downtime (tiempo muerto)¶

  • El tiempo muerto se calculó como la proporción de espera (colas, spot, descarga) sobre el tiempo total de ciclo.
  • Indicadores generados:
    • Downtime promedio por ciclo.
    • Downtime ponderado por duración de ciclo.
    • Horas totales de downtime acumuladas.
  • Visualizaciones:
    • Boxplot comparativo de downtime % por modelo de equipo.
    • Ranking de las 20 combinaciones FECHA–EQUIPO con mayor downtime ponderado.
⏰ ANÁLISIS DE OPERACIONES POR HORA DEL DÍA
==================================================
✅ Columna 'Hora' encontrada

📊 CREANDO ANÁLISIS HORARIO...
RESUMEN POR HORA:
--------------------------------------------------------------------------------
Hora |  Ciclos | Tonelaje | Tiempo(h) | Distancia(km)
--------------------------------------------------------------------------------
   0 |    3251 |    400.0 |      0.77 |         11.4
   1 |    3147 |    399.0 |      0.78 |         11.7
   2 |    2816 |    400.0 |      0.81 |         11.9
   3 |    2943 |    400.0 |      0.81 |         12.0
   4 |    3037 |    400.0 |      0.77 |         11.3
   5 |    2674 |    401.0 |      0.77 |         11.4
   6 |     890 |    399.0 |      0.68 |          9.6
   7 |    1131 |    403.0 |      0.76 |         11.0
   8 |    2656 |    401.0 |      0.76 |         11.8
   9 |    3032 |    402.0 |      0.78 |         12.0
  10 |    3260 |    401.0 |      0.74 |         11.5
  11 |    3301 |    401.0 |      0.74 |         11.3
  12 |    3163 |    401.0 |      0.78 |         11.8
  13 |    3015 |    400.0 |      0.81 |         12.2
  14 |    3131 |    401.0 |      0.80 |         12.1
  15 |    3233 |    402.0 |      0.74 |         11.0
  16 |    3477 |    401.0 |      0.76 |         11.4
  17 |    3461 |    401.0 |      0.73 |         10.7
  18 |    1279 |    398.0 |      0.60 |          8.3
  19 |    1874 |    401.0 |      0.70 |          9.8
  20 |    3392 |    400.0 |      0.74 |         11.1
  21 |    3315 |    400.0 |      0.75 |         11.5
  22 |    3309 |    400.0 |      0.76 |         11.6
  23 |    3274 |    400.0 |      0.74 |         11.1
📈 ESTADÍSTICAS HORARIAS ADICIONALES
==================================================
ACTIVIDAD POR HORAS:
• Hora pico: 16h con 3477 ciclos
• Hora valle: 6h con 890 ciclos

TONELAJE POR HORAS:
• Mayor tonelaje: 403.0 ton a las 7h
• Menor tonelaje: 398.0 ton a las 18h
• Variación: 5.0 ton (1.3%)
⏰ Análisis temporal por horas completado!
Mes FECHA Turno TIEMPO_CICLO_HRS DISTANCIA_CICLO_KM Operation_Speed Turno_Speed
0 1 2025-01-01 Diurno 76.201029 1221.955 16.035938 101.829583
1 1 2025-01-01 Nocturno 106.012105 1610.137 15.188237 134.178083
2 1 2025-01-02 Diurno 112.659029 1714.580 15.219197 142.881667
3 1 2025-01-02 Nocturno 63.814078 879.043 13.775064 73.253583
4 1 2025-01-03 Diurno 116.632354 1694.086 14.525009 141.173833
... ... ... ... ... ... ... ...
519 9 2025-09-17 Nocturno 105.314043 1893.187 17.976586 157.765583
520 9 2025-09-18 Diurno 121.174027 2203.764 18.186769 183.647000
521 9 2025-09-18 Nocturno 136.884859 2385.886 17.429875 198.823833
522 9 2025-09-19 Diurno 137.050946 2409.884 17.583855 200.823667
523 9 2025-09-19 Nocturno 110.478200 1884.563 17.058234 157.046917

524 rows × 7 columns

📅 ANÁLISIS DE OPERACIONES POR MES
==================================================
✅ Columna 'Mes' encontrada

📊 CREANDO ANÁLISIS MENSUAL...

RESUMEN POR MES:
------------------------------------------------------------------------------------------------------------------------
         Mes |   Ciclos |  Tonelaje |  Total Ton |  Tiempo(h) |  Distancia |  Ajustes | % Ajustes
------------------------------------------------------------------------------------------------------------------------
       Enero |     7825 |     398.0 |    3105000 |       0.74 |        9.9 |     1958 |      25.0%
     Febrero |     6404 |     398.0 |    2548231 |       0.82 |       10.3 |     1092 |      17.1%
       Marzo |     8372 |     401.0 |    3355426 |       0.74 |        9.4 |     1479 |      17.7%
       Abril |     7971 |     402.0 |    3203266 |       0.66 |        8.8 |     1549 |      19.4%
        Mayo |     8042 |     401.0 |    3225433 |       0.80 |       12.1 |     2182 |      27.1%
       Junio |     8116 |     402.0 |    3259431 |       0.80 |       12.8 |     2591 |      31.9%
       Julio |     7290 |     401.0 |    2924929 |       0.78 |       12.6 |     1847 |      25.3%
      Agosto |     8221 |     401.0 |    3296542 |       0.74 |       12.1 |     2122 |      25.8%
  Septiembre |     5820 |     401.0 |    2334622 |       0.75 |       12.5 |     1665 |      28.6%
📈 ESTADÍSTICAS MENSUALES ADICIONALES
==================================================
ACTIVIDAD POR MESES:
• Mes pico: Marzo con 8372 ciclos
• Mes valle: Septiembre con 5820 ciclos
• Variación: 2552 ciclos (43.8%)

TONELAJE POR MESES:
• Mayor tonelaje total: 3,355,426 ton en Marzo
• Menor tonelaje total: 2,334,622 ton en Septiembre
• Variación: 1,020,804 ton (43.7%)

AJUSTES POR MESES:
• Mayor % de ajustes: Junio con 31.9%
• Menor % de ajustes: Febrero con 17.1%

PROMEDIOS MENSUALES:
• Ciclos promedio por mes: 7562
• Tonelaje promedio por mes: 3,028,098 ton
• % promedio de ajustes: 24.2%

TENDENCIAS SEMESTRALES:
• Primer semestre - Ciclos promedio: 7788
• Segundo semestre - Ciclos promedio: 7110
• Tendencia anual: a la baja
📅 Análisis temporal por meses completado!
📈 ESTADÍSTICAS DE TENDENCIA
==================================================
• Pendiente de la tendencia: 0.0098% por día
• Coeficiente de correlación (R): 0.122
• Coeficiente de determinación (R²): 0.015
• P-valor: 0.047908
• Tendencia estadísticamente significativa: SÍ

📊 COMPARACIÓN TEMPORAL:
• Promedio primer tercio: 52.99%
• Promedio último tercio: 54.81%
• Cambio: +3.4%

💡 RESUMEN EJECUTIVO:
• Total de equipos analizados: 31
• Período analizado: 2025-01-01 a 2025-09-20
• Promedio diario de tiempo perdido: 54.53%
• Máximo tiempo perdido en un día: 67.01%
• Mínimo tiempo perdido en un día: 7.01%

Analisis TKPH¶

Mes Tipo TKPH
0 enero Original 384.642007
1 enero Original 458.934897
2 enero Original 220.267333
3 enero Original 254.420173
4 enero Original 203.297485
... ... ... ...
27095 septiembre Operacional 1322.223765
27096 septiembre Operacional 1662.058464
27097 septiembre Operacional 1642.016824
27098 septiembre Operacional 1573.532709
27099 septiembre Operacional 1358.504994

27100 rows × 3 columns

Mes Tipo TKPH Mes_EN
0 enero Original 384.642007 January
1 enero Original 458.934897 January
2 enero Original 220.267333 January
3 enero Original 254.420173 January
4 enero Original 203.297485 January
... ... ... ... ...
27095 septiembre Operacional 1322.223765 September
27096 septiembre Operacional 1662.058464 September
27097 septiembre Operacional 1642.016824 September
27098 septiembre Operacional 1573.532709 September
27099 septiembre Operacional 1358.504994 September

27100 rows × 4 columns

['January',
 'February',
 'March',
 'April',
 'May',
 'June',
 'July',
 'August',
 'September']
[25, 48, 64, 26, 3, 1, 1, 1, 2]
ANÁLISIS TKPH - AGREGACIÓN POR TURNO
=================================================================
DATOS ANTES DEL FILTRADO DE HORAS
Total de registros: 14,457 (turnos)
Período: 2025-01-01 00:00:00 a 2025-09-19 00:00:00
Equipos únicos: 31
Rango de horas: 0.19 - 10.87

ANÁLISIS KDE 3D - DATOS ORIGINALES
========================================
Datos para KDE 3D: 14,457 registros
APLICANDO FILTRO: HORAS >= 1
===================================
IMPACTO DEL FILTRO:
• Registros antes: 14,457
• Registros con horas < 1: 907 (6.3%)
• Registros después: 13,550
• Registros eliminados: 907 (6.3%)

KDE 3D - DATOS FILTRADOS (Horas >= 1)
========================================
Datos para KDE 3D filtrado: 13,550 registros
ESTADÍSTICAS DESCRIPTIVAS - DATOS FILTRADOS
=======================================================
       TKPH_Original  TKPH_Operacional  Hours_operation
count       13550.00          13550.00         13550.00
mean          434.47           1337.06             3.88
std           211.39            227.45             1.74
min            41.57            421.22             1.00
25%           268.95           1189.61             2.51
50%           409.16           1327.43             3.72
75%           569.17           1474.52             5.05
max          1540.97           2996.06            10.87

DIFERENCIAS (DATOS FILTRADOS):
• Diferencia promedio: 902.59 TKPH
• Diferencia porcentual promedio: 293.7%
• Correlación entre métodos: 0.361
======================================================================
📊 ANÁLISIS: CORRELACIÓN TKPH vs PRECIPITACIÓN
======================================================================

COEFICIENTES DE CORRELACIÓN (Pearson):
• TKPH Original vs Precipitación: nan
• TKPH Operacional vs Precipitación: nan

INTERPRETACIÓN:
• TKPH Original: Correlación Muy fuerte
• TKPH Operacional: Correlación Muy fuerte

RESUMEN MENSUAL:
------------------------------------------------------------------------------------------
Empty DataFrame
Columns: [TKPH Original (Prom), TKPH Operacional (Prom), Precipitación (mm)]
Index: []

ANÁLISIS DE TEMPORADA DE LLUVIAS:
--------------------------------------------------

======================================================================
✅ Gráfico guardado: tkph_precipitacion_mensual.html
======================================================================

PRUEBAS DE HIPÓTESIS ESTADÍSTICAS - DATOS FILTRADOS
============================================================
PRUEBAS DE NORMALIDAD (Shapiro-Wilk):
• TKPH Original: W = 0.9641, p-valor = 1.55e-33
• TKPH Operacional: W = 0.9867, p-valor = 2.49e-21
• Distribución normal: NO (α = 0.05)

PRUEBA DE DIFERENCIAS PAREADAS:
• Prueba utilizada: Wilcoxon signed-rank
• W-estadístico: 0.0000
• P-valor: 0.00e+00
• Diferencia estadísticamente significativa: SÍ (α = 0.05)

TAMAÑO DEL EFECTO:
• Cohen's d: 3.635
• Magnitud del efecto: grande

ANÁLISIS MENSUAL DETALLADO - DATOS FILTRADOS
=======================================================
enero:
  • N = 1556, Diferencia promedio = 877.81
  • P-valor = 0.0000, Significativo: SÍ
febrero:
  • N = 1389, Diferencia promedio = 813.82
  • P-valor = 0.0000, Significativo: SÍ
marzo:
  • N = 1630, Diferencia promedio = 799.77
  • P-valor = 0.0000, Significativo: SÍ
abril:
  • N = 1524, Diferencia promedio = 862.64
  • P-valor = 0.0000, Significativo: SÍ
mayo:
  • N = 1625, Diferencia promedio = 904.41
  • P-valor = 0.0000, Significativo: SÍ
junio:
  • N = 1603, Diferencia promedio = 954.04
  • P-valor = 0.0000, Significativo: SÍ
julio:
  • N = 1611, Diferencia promedio = 974.85
  • P-valor = 0.0000, Significativo: SÍ
agosto:
  • N = 1603, Diferencia promedio = 981.84
  • P-valor = 0.0000, Significativo: SÍ
septiembre:
  • N = 1009, Diferencia promedio = 963.47
  • P-valor = 0.0000, Significativo: SÍ

ESTADÍSTICAS DEL ANÁLISIS KDE 3D
========================================
KDE 3D DATOS ORIGINALES:
• TKPH Original - Densidad máxima: 0.00154945
• TKPH Operacional - Densidad máxima: 0.00036940

KDE 3D DATOS FILTRADOS:
• TKPH Original - Densidad máxima: 0.00159819
• TKPH Operacional - Densidad máxima: 0.00039740

PUNTOS DE MÁXIMA DENSIDAD (DATOS FILTRADOS):
TKPH Original:
• TKPH: 234
• Horas: 2.3
TKPH Operacional:
• TKPH: 1280
• Horas: 3.8

RESUMEN EJECUTIVO - ANÁLISIS COMPLETO
=============================================
IMPACTO DEL FILTRO DE HORAS:
• Se eliminaron 907 registros (6.3%)
• Análisis final con 13,550 registros

RESULTADOS FINALES (Horas >= 1):
• El TKPH Operacional es 902.6 unidades mayor que el TKPH Original
• Esta diferencia ES estadísticamente significativa
• Correlación entre métodos: 0.361
• Fuerza de correlación: Débil
• El tamaño del efecto es grande

INSIGHTS CLAVE:
• 6.3% de los datos originales tenían < 1 hora de operación
• TKPH promedio de registros eliminados: Orig=78.9, Op=1283.0
• Concentración máxima de densidad KDE:
  - TKPH Original: 0.00159819
  - TKPH Operacional: 0.00039740
  - TKPH Original muestra mayor concentración de valores

📦 BOXPLOTS SOLO TKPH_Original - POR AJUSTE
=======================================================